查看原文
其他

我又开发了个批量下载工具

苏生不惑 苏生不惑 2022-08-04

苏生不惑第340篇原创文章,将本公众号设为星标,第一时间看最新文章。

上周分享过因为读者的一个问题,我写了个公众号批量下载工具 ,这周我又增加了视频批量下载和话题批量下载,也用python打包了个工具(在公众号后台回复公众号获取下载地址),输入公众号文章或话题链接就行。

单篇文章神雕侠侣,绝迹江湖!金庸经典武侠《神雕侠侣》大结局 的视频可以用idm下载。视频链接通过正则匹配来批量下载视频:

def video(res, headers):
    vid = re.search(r'wxv_.{19}',res.text).group(0)
    time.sleep(2)
    if vid:
        url = f'https://mp.weixin.qq.com/mp/videoplayer?action=get_mp_video_play_url&preview=0&vid={vid}'
        data = requests.get(url,headers=headers).json()
        video_url = data['url_info'][0]['url']
        video_data = requests.get(video_url,headers=headers)
        print('正在下载视频:'+trimName(data['title'])+'.mp4')
        with open(data['title']+'.mp4','wb'as f:
            f.write(video_data.content)

批量下载视频效果如图:

话题就以我的公众号话题为例:同样打开我打包的工具,输入话题链接开始下载:视频和音频都可以下载,如果有bug可以向我反馈:

部分代码如下:

topic_url = input('请输入话题地址:')
biz=re.search(r'__biz=(.*?)&',topic_url).group(1)
album_id=re.search(r'album_id=(.*?)&',topic_url).group(1)
response = requests.get(topic_url, headers=headers)
msgids = re.findall('data-msgid="(.*)"',response.text)
links = re.findall('data-link="(.*)"',response.text)
titles = re.findall('data-title="(.*)"',response.text)
for i,j,k in zip(msgids,links,titles):
 print('开始下载',j,k)
 msgid = i
 res = requests.get(j,proxies={'http': None,'https': None},verify=False, headers=headers)
 content = res.text.replace('data-src''src'
 title = re.search(r'var msg_title = \'(.*)\'', content).group(1)
 ct = re.search(r'var ct = "(.*)";', content).group(1)
 date = time.strftime('%Y-%m-%d', time.localtime(int(ct)))
 try:
  audio(res,headers,date,title)
  video(res,headers,date)
  with open(date+'_'+k+'.html''w', encoding='utf-8'as f:
   f.write(content)
 except Exception as err:
  with open(str(randint(1,10))+'.html''w', encoding='utf-8'as f:
   f.write(content)
 

如果还想批量下载公众号文章可以参考之前文章一键批量下载微信公众号文章内容/图片/封面/视频/音频,支持导出html和pdf格式,包含阅读数/点赞数/在看数/留言数 , 文章数据包含文章日期,文章标题,文章链接,文章简介,文章作者,文章封面图,是否原创,阅读数,在看数,点赞数和留言数,比如我抓取过深圳卫健委的公众号数据听说公众号深圳卫健委被网友投诉尺度大,我抓取了所有文章标题和阅读数分析了下

留言内容可以下载抓取了公众号历史文章的留言 ,如果你有需要下载的公众号或抓取数据可以微信联系我。

再次推荐下我的博客https://blog-susheng.vercel.app ,可以在线看部分公众号文章10 分钟带你免费搭建一个属于自己的博客以及之前分享过的网站,Windows软件,app,chrome扩展,油猴脚本系列等,还在不断更新:

最后更新了下之前分享过的知乎回答抓取工具 一键下载QQ空间相册,微博相册,知乎回答图片,豆瓣图片,instagram图片输入问题id,很快就下载了几百张周杰伦的图片:

回答内容也批量下载到excel,包括回答人昵称和回答内容:

最近原创文章:

加入我的知识星球

视频下载神器加 1

解除b站番剧区域限制,这个特殊版本的 b 站 app 功能太强了

2022 年值得安装的几个 chrome/edge 扩展神器

2022 百度网盘/阿里云盘搜索合集,找资源不再愁

2022 最新一键下载百度文库/豆丁/道客巴巴/原创力文档

一键批量下载微信公众号文章内容/图片/封面/视频/音频,支持导出html和pdf格式,包含阅读数/点赞数/在看数/留言数

网易云音乐每天自动听歌300首升级LV10,b站每天自动签到升级LV6,京东每天自动签到领京豆,微信运动每天自动修改步数

分享几个音乐神器 APP,免费听全网音乐,一键解锁网易云音乐变灰歌曲

2022 年 一键修改微信运动步数

如果文章对你有帮助还请 点赞/在看/分享 三连支持下, 感谢各位!

公众号苏生不惑



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存